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(54) Verfahren zur Herstellung von naturlich gefalteten und sekretierten Proteinen 



(57) Ein Verfahren zur Herstellung eines wasserlos- 
lichen, naturlich gefalteten eukaryontischen Polypep- 
tide enthaltend zwei oder mehrere uber Disulfidbrucken 
verknupfte Cysteine, durch Kultivierung prokaryonti- 
scher Zellen, a) wobei die genannten prokaryontischen 
Zellen einen Express ionsvektor enthaften, der fur das 
genannte Polypeptid, das am N-Terminus eine proka- 
ryontische Signalsequenz enthalt, codiert, b) unter Be- 
dingungen, bei denen das Polypeptid in das Periplasma 
oder das Medium sekretiert wird, c) Abspaltung der Si- 



gnalsequenz und Isolierung des Polypeptids aus dem 
Periplasma oder dem Medium, dadurch gekennzeich- 
net, da6 die Kultivierung in Gegenwart von Arginin oder 
einer Verbindung der allgemeinen Formel I Rg-CO- 
NRR 1 (I) erfolgt, wobei R und R 1 Wasserstoff oder eine 
gesattigte oder ungesattigte verzweigte oder unver- 
zweigte C, - C 4 -Alkylkette und R 2 Wasserstoff, NHR, 
oder eine gesattigte oder ungesattigte verzweigte oder 
unverzweigte - C 3 -Alkylkette darstellen, ist zur re- 
kombinanten Herstellung von Polypeptiden in Proka- 
ryonten mit hoher Ausbeute geeignet. 
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Beschreibung 

[0001] Die Erfindung betrifft ein Verfahren zur Herstellung von wasserloslichen, naturlich gefalteten und sekretrierten 
Polypeptiden nach Expression in prokaryontischen Zellen. 

[0002] In prokaryontischen Organismen findet die Proteinsynthese, auch Translation genannt, an den Ribosomen 
im Cytoplasma statt. Bei einer Expression rekombinanter DNA in prokaryontischen Wirtsorganismen ist es oft wun- 
schenswert, dafB das dabei erhaltene rekombinante Genprodukt bzw Protein aus dem Cytoplasma durch die innere 
bakterielle Membran in den periplasmatischen Raum zwischen innerer und auBerer Membran sekretiert wird Vom 
Periplasma konnen sekretierte Proteine dann z.B. durch einen osmotischen Schock in das Nahrmedium freigesetzt 
werden. Ein Nachteil dieses Verfahrens ist, daB die sezernierten Polypeptide haufig nicht die native biologisch aktive 
Konformation ausbilden (Hockney, TIBTECH 12 (1994) 456 - 463). 

[0003] In jungster Zeit wurden molekulare Chaperone und Faltungskatalysatoren, wie Peptidyl-Prolyl-cis/trans-lso- 
merasen oder Proteindisulfidisomerasen (Glockshuber etaL, EP-A0 510 658) eingesetzt, um die Ausbeute an nativem 
rekombmanten Protein bei der Faltung in vivo zu erhohen (Thomas et aL, Appl. Biochem. Biotechnol. 66 (1997) 
197-238). Dies fuhrte teilweise zu erheblichen Verbesserungen bei der Expression z.B. von Ribulosebisphosphat- 
Carboxylase (RUBISCO; Goioubinoff et aL, Nature 337 (1989) 44-47), humaner Procollagenase (Lee & Olins, J Biol 
Chem. 267 (1 992) 2849-2852) Oder neuronaler Stickstoffoxidsynthase aus Ratten (Roman et al., Proc. Natl Acad Sci 
USA 92 (1995) 8428-8432). In diesen Beispielen wurden GroEL/ES bzw. das DnaK-System aus E. coli im Cytosol co- 
uberexprimiert. Der positive Effekt liegt dabei meist in einer erhohten Anreicherung des gewunschten Proteins in 16s- 
20 licher Form. 

[0004] Auch bei der Sekretion rekombinanter Proteine ins Periplasma von E. coli wurde die Co-Expression von 
Chaperone untersucht. Hier wurde jedoch nur eine cytosolische Uberexpression von Chaperone erprobt, um die Se- 
kretion ins Periplasma zu optimieren (Perez-Perez et aL, Biochem. Biophys. Res. Commun. 210 (1995) 524-529" Sato 
et al. : Biochem. Biophys. Res. Commun. 202 (1 994) 258-264; Berges et al., Appl. Environ. Microbiol. 62 (1 996) 55-60) 
2S Bishenge Versuche zur Co-Sekretion in E. coli betrafen nur Faltungshelfer-Proteine, wie z. B. Proteindisulfidisomerase 
(PDI; Glockshuber et aL, EP-A 0 510 658) oder Peptidyl-Prolyl-cis/trans-lsomerasen oder Dsb-Proteine (Knappik et 
aL, Bio/Technology 11(1993) 77-83; Qiu et aL, Appl. Environm. Microbiol. 64 (1998) 4891-4896 und Schmidt et al 
Prot. Engin. 11 (1998) 601 - 607. 

[0005] Verbindungen wie Harnstoff oder Harnstoffderivate, Formamid, Acetamid oder L-Arginin werden bei Verfahren 
30 zur tn vitro Renaturierung von unloslichen Proteinaggregaten (Inclusion bodies - EinschluBkorper) eingesetzt, die bei 
der cytoplasmatischen Expression von rekombinanter DNA in prokaryontischen Zellen entstehen. L-Arginin kann als 
Zusatz bei der Renaturierung in vitro die Ausbeute an nativ gefalteten Proteinen erheblich verbessern (Rudolph et al 
US-Patent Nr. 5,593,865; Buchner & Rudolph, Bio/Technology 9 (1991)157-162; Brinkmann et aL, Proc Natl Acad* 
Sci USA 89 (1992) 3075-3079; Lin & Traugh : Prot. Express. Purif. 4 (1993) 256-264). 
3S [0006] Aufgabe der Erfindung ist es, ein Verfahren zur Herstellung von wasserloslichen, naturlich gefalteten euka- 
ryontischen Polypeptiden nach Expression in Prokaryonten zur Verfugung zu stellen, welches auf einfache Weise 
durchf uhrbar ist und bei dem eine aufwendige in vitro-Nachbehandlung, wie Aufldsung von inclusion bodies, Reduktion 
und Naturierung, nicht erforderlich ist. 

[0007] Die Aufgabe wird gelost durch ein Verfahren zur Herstellung eines wasserloslichen, naturlich gefalteten eu- 
karyontischen Polypeptids : enthaltend zwei oder mehrere uber Disulfidbrucken verknupfte Cysteine, durch Kultivierunq 
prokaryontischer Zellen, 

a) wobei die genannten prokaryontischen Zellen einen Expressionsvektor enthalten, der fur das genannte Poly- 
peptid, das am N-Terminus eine prokaryontische Signalsequenz enthalt, codiert 

b) unter Bedingungen, bei denen das Polypeptid in das Periplasma Oder das Medium sekretiert wird, 

c) Abspaltung der Signalsequenz und Isolierung des Polypeptids aus dem Periplasma oder dem Medium, 
dadurch gekennzeichnet, daB die Kultivierung in Gegenwart von Arginin oder einer Verbindung derallgemeinen Formel 
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R und Wasserstoff oder eine gesattigte oder ungesattigte verzweigte oder urwerzweigte C 1 -C 4 -Alky!kette und 

R 2 Wasserstoff, NHR n oder eine gesattigte oder ungesattigte verzweigte oder unverzweigte C n -C 3 -Alkylkette dar- 
stellen. 

5 

[0008] Vorzugsweise betragt die Konzentration von Arginin oder der Verbindung der allgemeinen Formel I minde- 
stens 0 : 1 mol/l, kann aber auch deutlich hoher sein : solange die Loslichkeit von Arginin oder der genannten Verbindung 
gewahrleistet ist. Bevorzugt werden Arginin oder die Verbindungen der allgemeinen Formel I in einer Konzentration 
von 0,1 bis 1,5 mol/l verwendet. 
w [0009] Als Verbindungen der allgemeinen Formel I werden vorzugsweise Formamid, Acetamid, Harnstoff oder Harn- 
stoffderivate, wie Ethylharnstoff oder Methylharnstoff zum Nahrmedium, welches fur die Kultivierung der prokaryonti- 
schen Zellen verwendet wird, zugesetzt. Arginin kann beispielsweise als Hydrochlorid oder als andere titrierte Form 
der Base Arginin verwendet werden. Vorzugsweise wird jedoch L-Arginin, besonders bevorzugt die Hydrochloridform 
von L-Arginin t verwendet. 

is [0010] In einer bevorzugten Ausfuhrungsform des erfindungsgemaGen Vertahrens werden dem zur Kultivierung der 
prokaryontischen Zellen verwendeten Nahrmedium (Fermentationsmedium) zusatzlich reduzierende Thiolreagenzien, 
welche SH-Gruppen enthalten, zugesetzt, wobei die Ausbeute an rekombinant gewonnenem Protein weiter erhoht 
wird. Vorzugsweise werden 0,1-15 mmol/l Thiolreagenz zugesetzt. ErfindungsgemaB ist unter dem Begriff "Thiolrea- 
genz" entweder ein reduzierendes (reduziertes) Thiolreagenz mit SH-Gruppen oder ein Gemisch von reduzierenden 

20 Thiolreagenzien mit SH-Gruppen und oxidierenden Thiolreagenzien mit Disulfidgruppen zu verslehen. Bevorzugle 
Substanzen sind reduziertes Glutathion (GSH), Cystein, N-Acetylcystein, Cysteamin, p-Mercaptoethanol undahnliche 
Verbindungen. Die Thiolreagenzien konnen sowohl einzeln als auch in Gemischen verwendet werden. Besonders 
geeignet sind Thiolreagenzien wie beispielsweise Glutathion (GSH), die eine einzige SH-Gruppe pro Molekul aufwei- 
sen. Thiolreagenzien wie Glutathion, sind fOr die Verbesserung der Ausbeute nativ gefalteter Proteine bei der Expres- 

2S sion rekombinanter DNA in prokaryontischen Zellen bekannt (Glockshuber et al., EP-A 0 510 658). 

[0011] In einer weiteren bevorzugten Ausfuhrungsform des erfindungsgemaften Vertahrens werden zusatzlich mo- 
lekulare Chaperone uberexprimiert und cosekretiert. Unter Chaperonen gemaG der Ertindung sind Proteine zu verste- 
hen, die andere, nicht-native Proteine in vivo vor Aggregation schutzen und die Ausbildung ihrer nativen Kontormation 
fordern. Molekulare Chaperone werden im Stand der Technik eingesetzt, um Proteine zu stabilisieren und damit vor 

30 Aggregation und Inaktivierung zu schutzen (Buchner et al. , EP-A 0 556 726 A1 ). Vorzugsweise werden ATP-unabhan- 
gige Chaperone des HSP40-Typs (Molmasse ca. 40 kDa) oder ein kleines Hitzeschockprotein (sHSP) verwendet. 
DnaJ ist ein 40 kDa Hitzeschockprotein, das im Cytoplasma von E. coli vorkommt und Teil des sogenannten 
Hsp70-Chaperonsystems ist (Bukau, B. & Horwich, A., Cell 92 (1998) 351-366). Zudiesem System gehoren auBerdem 
DnaK (Hsp70) und GrpE. Bestimmte Proteine werden durch das DnaK-System in einem ATP-abhangigen ProzeB zur 

35 nativen Kontormation gefaltet (Schroder et al., EMBO J. 12 (1993) 4137-4144; Langer et al., Nature 356 (1992) 683 - 
689). Zur Ruckfaltung denaturierter Proteine benotigt dieses System zusatzlich ATP. DnaJ schutzt in Abwesenheit von 
DnaK und ATP nicht-native Proteine vor Aggregation und vermittelt einen Faltungs-kompetenten Zustand (Schroder 
et al., EMBO J. 12 (1993) 4137-4144). Weiterhin bevorzugt ist die Co-Sekretion eines N-terminalen Fragmentes von 
DnaJ, das die Aminosauren 1-108 umfaGt und im Folgenden als "J-Domane" (Kelley, TIBS 23 (1998) 222-227) be- 

40 zeichnet wird. in diesem Bereich befinden sich die J-Domane und eine G/F-reiche Domane, die Wechselwirkungen 
mit DnaK ausuben (Wall et al., J. Biol. Chem. 270 (1995) 2139-2144). Es wurde gezeigt, daB die Co-Expression von 
DnaJ im Cytosol zur Erhohung der Ausbeute an loslichem Protein fuhren kann (Yokoyama et al., Microbiol. Ferment. 
Technol. 62 (1998) 1205-1210). 

[0012] Hsp25 (z.B. aus der Maus) ist ein Vertreter der kleinen Hitzeschockproteine (Gaestel et aL, Eur. J. Biochem. 

45 179 (1989) 209-213), einer Klasse von Chaperonen, die ubiquitar verbreitet ist: Die Molmasse dieser Proteine liegt 
zwischen 15 und 30 kDa. Bei Hitzeschock werden die sHsps in der Zelle stark angereichert (bis zu 1 % des Gesamt- 
zellproteins - Arrigo & Landry (1994), In Morimoto (Hrsg.): The Biology of Heat Shock Proteins and Molecular Chape- 
rones, Cold Spring Harbour Press, 335-373). Wie DnaJ-Proteine besitzen sHsps die Eigenschaft, die Aggregation von 
nichtnativen Proteinen zu verhindern und diese in einem faltungskompetenten Zustand zu halten (Jakob etal., J. Biol. 

50 Chem. 268(1993) 1517-1520; Ehrsperger etal., EMBO J. 16 (1997)221-229). 

[0013] Der Begriff "Oberexpression" gemaG vorliegender Erfindung bedeutet eine Steigerung der Expression der 
sekretierten Proteine wie z.B. DnaJ- und Hsp25 (vorzugsweise um mindestens 100%) im Vergleich zur Expression im 
Wildtyp des jeweils verwendeten prokaryontischen Wirtsorganismus. Eine solche Uberexpression laGt sich z.B. da- 
durch erreichen, daft sich die Gene (fur das Protein, Chaperon und/oder Signalpeptid) unter Kontrolle eines starken 

55 prokaryontischen, vorzugsweise induzierbaren Expressionssignals (z.B. eines lac- oder T7-Promotors oder eines De- 
rivates davon) befinden. 

[0014] Das Sekretionskonstrukt fur die Uberexpression der Polypeptide (Proteine) samt regulatorischer Regionen 
(Promotor und Terminator) auf der rekombinanten DNA ist vorzugsweise in einen Vektor, welcher zusatzlich die in 
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Prokaryonten seltene Arginin-tRNA aga/agg codiert rntegriert Oder wird mit einem Vektor, welcher diese tRNA codiert, 
co-exprimiert (Brinkmann et al., Gene 35 (1989) 109-114). Dies ermoglicht sowohl die Co-Uberexpression der jewei- 
ligen Proteine ins bakterielle Periplasrna als auch die Transkription der seltenen tRNA Ar 9 AGA/AGG[ was eine erhohte 
Synthese des gewunschten Proteins im bakteriellen Wirtsorganismus zur Folge hat. 

[0015] Unter einer prokaryontischen Signalsequenz im Sinne der Erfindung ist ein Nukleinsaurefragment zu verste- 
hen, welches aus Prokaryonten : vorzugsweise aus gramnegativen Bakterien, abgeleitet ist und das Durchdringen von 
an das Signatpeptid gebundenen Proteinen durch die inneren bakteriellen Membranen gewahrleistet. Dadurch werden 
die Proteine im Peripiasma bzw. im Zelluberstand lokalisiert. Solche Signalsequenzen haben ublicherweise eine Lange 
von 18 - 30 Aminosauren und sind beispielsweise beschrieben in Murphy & Beckwith: Export of Proteins to the Cell 
Envelope in Escherichia coli und in Neidhardt et al. (Hrsg.): Escherichia coli and Salmonella, Second Edition, Vol. 1, 
ASM Press, Washington, 1996, S. 967-978. Die Abspaltung von bakteriellen Signalsequenzen kann z.B. nach einer 
Sequenz Ala-X-Ala stattfinden (von Heijne eta!., J. MoL Biol. 184 (1985) 99-105). Die Strukturder bakteriellen Signal- 
peptidase ist beschrieben in Paetzel et al., Nature 396 (1998) 186-190. Vorzugweise werden Signalsequenzen ver- 
wendet> welche durch im Peripiasma von prokaryontischen Zellen lokalisierten Proteasen vom gewunschten Protein 
wieder abgespalten werden. Alternativ kann durch Zugabe solcher Proteasen zum Zelluberstand oder zum isolierten 
Protein die Abspaltung der Signalsequenz ertolgen. 

[0016] Mit dem eriindungsgemaBen Verfahren kann die heterologe Expression einer Vielzahl von eukaryontischen 
D roteinen wie z.B. Proteasen, Interferone, Protein hormone, Antikorper oder Fragmenten davon verbessert werden. 
Besonders geeignet ist das Verfahren fur die heterologe Herstellung von Proteinen, die im nativen Zustand mindestens 
zwei Ober eine Disulfidbrucke verknupfle Cysteine enthallen und dann, wenn sie N-terminal keine fusionierte proka- 
ryontische Signalsequenz besitzen, bei der prokaryontischen Expression als unlosliche inclusion bodies entstehen. 
Besonders geeignet ist das Verfahren fur Proteine, die mehr als 5 Disulfidbrucken in nativem Zustand enthalten. Ein 
solches Protein ist beispielsweise ein rekombinanter Plasminogenaktivator (im folgenden rPA genannt, Martin et al., 
Cardiovasc. Drug Rev. 11 (1993) 299-311 , US-Patent Nr. 5,223,256). rPA besitzt 9 Disulfidbrucken, die im reduzieren- 
den Cytosol von E. coli nicht ausgebildet werden. 

[0017] Dabei wird die periplasmatische Lokalisation des Proteins, und gegebenenfalls des Chaperons, durch "ope- 
rative Verknupfung" mit einem Signalpepttd zum Durchdringen innerer bakterieller Membranen gewahrleistet. 
[0018] Bei der Expression eines solchen Plasminogenaktivators stellte sich eine Konzentration von 0,4 mol/l L-Ar- 
ginin und 5 mmol/l Glutathion (bei Co-Sekretion von DnaJ, J-Domane, Hsp25 sowie ScFv) bzw. 0,4 mo!/l L-Arginin 
ohne Glutathion (ohne Co-Sekretion von DnaJ) als optimal heraus. 

[0019] Zur Gewinnung des sekretorischen rPA-Proteins in funktionaler Form in E. coli wurde das Gen fOr dieses 
Protein aus dem Plasmid pA27fd7 (Kohnert et aL Protein Engineering 5 (1 992) 93-1 00) mit gentechnologischen Mitteln 
an eine prokaryontische Signalsequenz gramnegativer Bakterien, beispielsweise an die Signalsequenz von Pectat- 
lyase B (PelB) von Erwinia amylovora, fusioniert. Die Genfusion wurde durch Klonierung in den Vektor pET20b(+) 
(Novagen Inc., Madison, USA) hergesteilt. Damit unterliegt die Genexpression der Kontrolle des T7-Promotors. Die 
im Fusionsprotein vorhandene Signalsequenz bewirkt die Sekretion ins Peripiasma. Wahrend oder nach der Sekretion 
wird die Signalsequenz durch eine in der inneren Membran lokalisierte Peptidase abgespalten. Sezerniertes Protein 
kann dann im Peripiasma fallen. Die oxidierenden Bedingungen dieses Kompartiments ermoglichen die Ausbildung 
von Disulfidbrucken. Durch den erfindungsgemaBen Zusatz von niedermolekularen faltungsverbessernden Proteinen 
und Thiolragenzien im Nahrmedium und gleichzeitiger Co-Uberexpression von DnaJ, J-Domane oder Hsp25 im Peri- 
piasma gelingt es, die Ausbeute an funktionalen Protein urn menr als das 100-fache zu steigern. 
[0020] Weitere Beispiele von erf indungsgemafcen Polypeptiden sina Antikorper oder Antikorperfragmente, beispiels- 
weise ein Single-Chain Fy-Fragment (ScF v , z.B. gegen das Schilddrusenstimulierende Hormon (thyroide stimulating 
hormone, TSH). ScFvs sind verkurzte Antikorper, die nur aus den variablen Abschnitten (F v ) der schweren und leichten 
Kette eines Antikorpers bestehen, die uber einen kurzen (meist Gly 4 Ser 3 ) Linker kunstlich fusioniert sind (Hudson, 
Curr. Opin Biotechnol. 9 (1998) 395-402). ScF v s haben normalerweise die gleiche Affinitat zum Antigen wie die pa- 
ternalen Fv-Strange, konnen jedoch in E. coli uberexprimiert werden. Da sie stabilisierende intradomanen-Disulfidbruk- 
ken besitzen, die essentiell fur die Stabilitat sind, fuhrt eine Expression im Cytosol meist zur Bildung von Inclusion 
Bodies (Obersichtsartikel: Shibui et al., Appl. Microbiol. Biotechnol. 37 (1992) 352-357). ScF v s konnen durch Zufalls- 
mutationen und anschlieGende Phage-Display-Selektion auf Bindung gewunschter Antigene gezielt optimiert werden 
(Obersichtsartikel: Allen et aL, TIBS 20 (1995) 511-516). Durch Zugabe von 5 mM GSH und 0,4 M L-Arginin konnte 
die Ausbeute an funktionellem ScFv-TSH im Peripiasma urn das 10-fache und im Medienuberstand urn das 40-fache 
gegenuber einer Kultivierung ohne Zusatze verbessert werden. 

[0021] Die folgenden Beispiele, Publikationen ; das Sequenzprotokoll und die Abbildungen erlautern die Erfindung, 
deren Schutzumfang sich aus den Patentanspruchen ergibt, weiter. Die beschriebenen Verfahren sind als Beispiele 
zu verstehen, die auch noch nach Modifikationen den Gegenstand der Erfindung beschreiben. 
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Beschreibung des Sequenzprotokolls 

[0022] SEQ ID NO: 1 unci 2 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-dnaJ. der fur 
das Fusionsprotein aus OmpA-Signalsequenz und DnaJ codtert, zusammen mil den reguiatorischen Sequenzen (Pro* 
5 motor, Terminator), die aus pIN HI ornpA3-dnaJ amplifiziert wurden. 

[0023] SEQ ID NO: 3 und 4 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-J-Domain, der 
fur das Fusionsprotein aus OmpA-Signatsequenz und J-Domane codiert, zusammen mit den reguiatorischen Sequen- 
zen (Promotor, Terminator), die aus pIN III ompA3-dnaJ amplifiziert wurden. 

[0024] SEQ ID NO: 5 und 6 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-hsp25 ; der fur 
io das Fusionsprotein aus OrnpA-Signalsequenz und Hsp25 codtert, zusammen mit den reguiatorischen Sequenzen (Pro- 
motor, Terminator), die aus pIN lit ompA3-hsp25 amplifiziert wurden. 

[0025] SEQ !D NO: 7 und 8 zeigen die Sequenz des Teils des Expressionsplasmides PUBS520-SCFVOX, der fur das 
Fusionsprotein aus PelB-Signalsequenz und ScFvOxazolon codiert, zusammen mit den reguiatorischen Sequenzen 
(Promotor Terminator), die aus pHEN-ScFv bzw. pIN III ompA3 amplifiziert wurden. 
is [0026] SEQ ID NO: 9 und 10 zeigen die Sequenz des Teils des Expressionsplasmides pET20b(+)-rPA, der fur das 
Fusionsprotein aus PelB-Signalsequenz und rPA codiert. 

Beschreibung der Figuren 

20 [0027] Fig. 1 zeigt die Abhangigkeit der Expression von nativem rPA im Periplasms von E. coli bei 5 mM GSH in 
Abhangigkeit von der L-Argininkonzentration und verschiedener Co-Sekretionskonstrukte. 

[0028] Fig. 2 zeigt einen Vergleich der Expression von rPA im Periplasma von E. co//BL21(DE3) bei Co-Sekretion 

von DnaJ und bei Zusatz von GSH und verschiedenen niedermolekularen faftungsverbessernden Stoff en zum Medium. 

[0029] Fig. 3 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-dnaJ. 
25 [0030] Fig. 4 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-J-Domain. 

[0031] Fig. 5 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-hsp25. 

[0032] Fig. 6 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-ScFvOx. 

[0033] Fig. 7 zeigt eine schematische Darstellung des Expressionsplasmides pET20b(+)-rPA. 

[0034] Fig. 8 zeigt die Abhangigkeit der Expression von funktionellem ScFv-TSH von der Konzentration von L-Arginin 
30 und GSH im Kulturmedium. 

[0035] (Werte wurden als relative Mengen bezuglich der Probe ohne Medienzus^tze (:1) berechnet.) 

[0036] Fig. 9 zeigt die Abhangigkeit der Expression von funktionellem ScFv-TSH von der Konzentration von L-Arginin 

und GSH im Periplasma von E. coll 

[0037] (Werte wurden als relative Mengen bezuglich der Probe ohne Medienzusatze (:1) berechnet.) 



35 



Allgemeines: 



[0038] Zur periplasmatischen Uberexpression von DnaJ, der J-Domane sowie Hsp25 in E. coli wurde die DNA, die 
fur diese Proteine codiert, mit gentechnologischen Mitteln an die Signalsequenz des Outer Membrane Proteins A 
40 (OmpA) von E. coli fusioniert und die Fusion auf einem rekombinanten Plasmid unter Kontrolle des lac-lpp-Promotors 
in E. coli exprimiert. Somit werden die Polypeptidkette von DnaJ und Hsp25 ins Periplasma des prokaryontischen 
Wirtsorganismus transportiert und dort nativ gefaltet. Die Lokaiisation und native Faltung konnte dabei durch limitierte 
Proteotyse mit Trypsin und Western Blot nachgewiesen werden. 

45 Beispiel 1 : 

Konstruktion des Expressionsplasmides pIN III omp A3-dnaJ 

[0039] Molekulargenetische Techniken beruhten auf Ausubel et al. (Hrsg.), J. Wiley & Sons, 1997, Curr Protocols 
50 of Molecular Biology. Oligonucleotide wurden von den Firmen MWG Biotech, Ebersberg oder GIBCO Life Sciences, 
Eggenstein, DE bezogen. 

[0040] Das Gen, das fur DnaJ codiert, Gene Bank Accession No. M 12565, wurde uber die Restriktionsschnrttstellen 
EcoRI und BamHI in das Expresstonsplasmid pIN III ompA3 (Ghayreb et al., EMBO J. 3 (1964) 2437-2442) kloniert. 
Die Sequenz des klonierten PCR-Fragments wurde durch Didesoxy-Sequenzierung (LiCor DNA-Sequencer 4000, 
55 MWG Biotech, Ebersberg) uberpruft. Das resultierende Plasmid wurde pIN III ompA3-dnaJ bezeichnet. Die Sequenz 
des periplasmatisch exprimierten DnaJ unterscheidet sich von dem Wildtyp-Protein dahingehend, daft die Polypep- 
tidsequenz mit Gly-lle-Pro beginnt statt mit Met, es fand somit eine Verlangerung des N-Terminus um 2 Aminosauren 
statt. DnaJ befindet sich damit unter Kontrolle des lac-lpp-Promotors, der mit IPTG (Isopropyl-p-D-Thiogalactosid) 
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induziert wird. 
Beispiel 2 : 

5 Konstruktion des Expressionsplasmides pUBS520-plN-dnaJ 

[0041] Mittels PCR wurde der Bereich aus dem Plasmid pIN III ompA3-dnaJ amplifiziert, der f Or das lac-lpp Operon, 
die Signalsequenz, das dnaJ-Gen und die Terminator-Region des Operons codiert (SEQ ID NO: 1). Das PCR-Produkt 
wurde mit der Restriktionsendonuclease Bglll geschnitten und in den mit der Restriktionsendonuclease BamHI linea- 
io risierten Vektor pUBS520 kloniert. Das resultierende Plasmid wurde pUBS520-plN-dnaJ bezeichnel (Fig. 3). 

Beispiel 3: 

Konstruktion des Expressionsplasmides pUBS 520-pIN-J-Domain 

1S 

[0042] Mittels des QuikChange-Mutagenese-Systems (Promega, Mannheim, DE) wurden im Plasmid pUBS 
520-plN-dnaJ nach dem Nucleotid 324 zwei Stop-Codone eingefugt. so daB nur noch die ersten 108 Aminosauren 
exprimiert werden. Die Sequenz des mutagenisierten Bereiches wurde durch Didesoxy-Sequenzierung (LiCor DNA- 
Sequencer4000, MWG Biotech, Ebersberg) und die Expression des verkurzten Proteinfragments durch Western Blot- 
to ting und Delektion mit einem Anti-DnaJ-Antikorper nachgewiesen. Das entstandene Plasmid wurde mit pUBS 520-plN- 
J-Domain (Fig. 4) bezeichnet. 

Beispiel 4: 

25 Konstruktion des Expressionsplasmides pIN III ompA3-hsp25 

[0043] Das Gen, das fur Hsp25 codiert, Gene Bank Accession No.: L 07577, wurde uberdie Restriktionsschnittstellen 
EcoRI und BamHI in das Expressionsplasmid pIN III ompA3 (Ghayreb et a/., EMBO J. 3 (1984) 2437*2442) kloniert 
Die Sequenz des klonierten PCR-Fragments wurde durch Didesoxy-Sequenzierung (LiCor DNA-Sequencer 4000, 
30 MWG Biotech, Ebersberg) uberprufl. Das resultierende Plasmid wurde pIN III ompA3-hsp25 bezeichnet. Die Sequenz 
des periplasmatisch exprimierten Hsp25 unterscheidet sich von dem Wildtyp-Prolein dahingehend, daB die Polypep- 
tidsequenz mit Giy-Ile-Leu beginnt statt mit Met, es tand somit eine Verlangerung des N-Terminus urn 2 Aminosduren 
statt. Hsp25 befindet sich damit unter Kontrolle des lac-lpp-Promotors, der mit IPTG (Isopropyl-P-D-Thiogalactosid) 
induziert wird. 

3S 

Beispiel 5: 

Konstruktion des Expressionsplasmides pUBS520-plN-hsp25 

40 [0044] Mittels PCR wurde der Bereich aus dem Plasmid pIN III ompA3-hsp25 amplifiziert, der fur das lac-lpp Operon, 
die Signalsequenz, das hsp25-Gen und die Terminator-Region des Operons codiert (SEQ I D NO: 5). Das PCR-Produkt 
wurde mit der Restriktionsendonuclease Bglll geschnitten und in den mit der Restriktionsendonuclease BamHI linea- 
risierten Vektor pUBS520 kloniert. Das resultierende Plasmid wurde pUBS520-plN-hsp25 bezeichnet (Fig. 5). 

45 Beispiel 6: 

Konstruktion des Expressionsplasmides pUBS520-ScFvOx 

[0045] AIs negativ-Kontrolle wurde die Co-Expression eines Single-Chain-Fv-Fragmentes, das gegen das Hapten 
50 Oxazolon gerichtetist (ScFvOxazolon; Fiedler und Conrad, Bio/Technology 13 (1 995) 1090-1 093 untersucht, das keine 
Chaperon-Eigenschaften besitzt. 

[0046] Mittels PCR wurde der Bereich aus dem Plasmid pHEN-ScFvOx amplifiziert, der fur den lac-Promotor, die 
Signalsequenz peiB und das sclvox-Gen codiert. In einer zweiten PCR wurde der Bereich aus dem Plasmid pIN III 
ompA3 amplifiziert, der fur den Ipp-Terminator codiert. In einer anschlieGenden PCR wurden die beiden Fragmente 
55 f usioniert. Das so entstandene PCR-Produkt (SEQ ID NO: 7) wurde mit der Restriktionsendonuclease Bglll geschnitten 
und in den mrt der Restriktionsendonuclease BamHI linearisierten Vektor pUBS520 kloniert. Das resultierende Plasmid 
wurde pUBS520-ScFvOx bezeichnet (Fig 6). 
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Beispiel 7: 

Konstruktion des Expressionsplasmides pET20b(+)-rPA 

s [0047] Mit Hilfe der PCR-Methode wurde das Gen eines Plasminogenaktivators (rPA) aus dem Plasmidvektor 
pA27fd7 (Kohnert et al., Protein Engineering 5 (1992) 93-100) amplifiziert. Das PCR-Produkt wurde mit den Restrik- 
tionsendonucleasen Ncot und BamHi gespalten und in den Plasmidvektor pET20b(+) (Novagen Inc., Madison, USA) 
kloniert. Das Plasmid codiert fur ein Fusionsprotein, welches aus der Signalsequenz von PelB (Pectatlyase aus Erwinia 
amylovora) und rPA besteht und die Sekretion von rPA ins Periplasma Didesoxy-Sequenzierung (LiCor DNA-Se- 

10 quencer 4000, MWG Biotech : Ebersberg : DE) uberpruft. Das Konstrukt wurde als pET20b(+)-rPA bezeichnet (Fig. 7). 
In dem Plasmid wird rPA unter Kontrolle des T7-Prornotors exprimiert, wobei die T7-RNA-Polymerase im Stamm E. 
coli BL21(DE3) der Kontrolle des lacUVS-Promotors unterliegt. Die Induktion erfolgt durch Zugabe von IPTG. Das 
periplasmatisch exprimierte rPA unterscheidet sich von dem bei Kohnert et al beschriebenen Plasminogenaktivator 
durch Austausch der zweiten Aminosaure (Ser) gegen Ala. 



15 



20 



Beispiel 8: 

Funktionale Expression von rPA im Periplasma von E. coli unter Verwendung der Medienzusatze Glutathion 
und L-Arginin 



[0048] Eine stationiiie Ubemachtkultur von E. coli BL21(DE3) (Studier & Moffat, J. Mol. Biol. 189 (1986) 113-130), 
die mit pET20o(-i )-rPA und pUBS520-plN-dnaJ transformiert wurde (Co-Expression von DnaJ), eine Ubemachtkultur 
von E. coli BL2KDE3} die mit pET20b(+)-rPA und pUBS520-plN-J-Domain transformiert wurde (Co-Expression der 
J-Domane) ; eine Jbcrnuchikulttr von E. coli BL21 (DE3), die mit pET20b(+)-rPAund pUBS520-plN-hsp25 transformiert 

25 wurde (Co-Exprcoson von Hsp25), eine Ubemachtkultur von E. coli BL21(DE3), die mit pET20b(+)-rPA und 
pUBS520-ScFvOx irnnslormion wurde (Co-Expression von ScFvOx), eine Ubemachtkultur von E. coli BL21(DE3), die 
mit pET20b(+)-rPA und OUBS520 iransformiert wurde bzw. eine Qbernachtkultur von E. coli BL21 (DE3), die mit pET20b 
(+) und pUBS520 transformer! wurde (Kontrollkultur), wurde im Verhaltnis 1:50 in 100 ml LB-Medium mit Ampicillin 
(100 u.g/m1) und KHnamycn (SO jig/ml, Fluka Chemica, Neu-Ulm, DE) verdunnt und bei 24°C und 170 rpm geschOttelt. 

30 Nach 3 h Wachslum wurden >.c 5ml der Kultur zu je 10 ml LB-Medium mit o.g. Mengen an Ampicillin und Kanamycin 
und verschiedenen Konzeniraticnen von GSH (0-10 mM. Fluka, DE) und L-Arginin HCI (0-0.4 M, ICN) gegeben und 
mitjeweils ImM IPTG (lsopropyl-|3-D-Thiogalactosid, AppliChem, Darmstadt, DE) induziert. Die Zellen wurden weitere 
21 h bei 24 °C und 170 rpm geschOttelt und nach Bestimmung der OD 600 eine 1 mi-Probe genommen. Diese 1ml- 
Zellproben wurden nach einer modifizierten Vorschrift nach Jacobi et al. (J. Biol. Chem. 272 (1997) 21692-21699) in 

35 2 ml-Eppendorf-ReaktionsgelaGen fraktioniert. Im Detail wurde das Zellpellet mit 500 jil Fraktionierungspuffer (150 
mM NaCi (Roth GmbH) ; 50 mM Tris/HCI (Roth GmbH, 5mM EDTA (Biomol) und 1 mg/ml Polymyxin-B-Sulfat (Sigma), 
pH 7 : 5) versetzt, 1 h bei 10 °C auf einem Eppendorf-Thermoschuttler bei 1400 rpm geschOttelt und dann 15 min bei 
1 4 000 rpm in einer auf 1 0°C gekuhlten Eppendorf-Mikrozentrif uge zentrif ugiert, so daB eine Fraktion mit den loslichen 
periplasmatischen Proteinen (Uberstand) und eine Restfraktion (Pellet) entstand. 

40 [0049] Die Bestimmung von der Aktivitat von rPA erfolgte im wesentlichen nach der Methode von Verheijen et al. 
Thromb. Haemostasis 48 (1982) 266-269). 

[0050] Alle ermittelten rPA-Konzentrationen in den Zellextrakten wurden auf Zellsuspensionen von OD 600 =1 nor- 
miert, um den Fehler der bei der Messung in verschiedenen Puffern auftrrtt, zu korrigieren. 

^5 Beispiel 9: 

Funktionale Expression von rPA im Periplasma von E. coll unter Verwendung von Gemischen aus Glutathion 
mit Formamid, Methylformamid, Acetamid, Methylharnstoff sowte Ethylharnstoff als Medienzusatze 

50 [0051] Eine stationare Ubemachtkultur von E. coli BL21 (DE3). die mit pET20b(+)-rPA und pUBS520-plN-dnaJ trans- 
formiert wurde (Co- Ex press ion von DnaJ), wurde wie in Beispiel 8 angegeben kultiviert. Zusatzlich wurden Verbindun- 
gen der Formel I und jeweils 5 mM Glutathion dem Kulturmedium zugesetzt. Eine Kontrollkultur wurde in LB ohne 
Zusatze kultiviert. Die Verbindungen der Formel I und ihre eingesetzte Konzentration sind in Tabelle 3 aufgefuhrt Die 
Probenaufbereitung, Periplasmaf raktionierung und der Enzymtest auf tPA-Aktivitat wurden wie in Beispiel 8 ausgefuhrt. 

ss [0052] Die Ergebnisse zur rPA Expression zeigen die Tabellen 1 und 2 sowie die Figuren 1 und 2. 
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[0053] Die Kultivierung erfolgte in Gegenwart von 5 mM GSH. 

Tabelle 2: 



Expression von nativern rPA im Periplasma von E. coli bei Co-Sekretion von DnaJ und Zusatz verschiedener 
niedermolekularer faltungsverbessernder Zusatze 



Zusatz 


Konzentration 


Menge rPA in 


Stimulationsfaktor 


OD 600 bei 


Konzentration 




im 


ng/mrOD 600 




Zellernte 


GSH im Medium 




Kulturmedium 


im Periplasma 








ohne Zusatze 


- 


0,153 


24 


4,52 


0 mM 


Arginin 


0,2 M 


0,560 


21 


4,45 


5 mM 




0,4 M 


3,880 


17 


1,73 


5 mM 


Formamid 


0,6 M 


0,208 


17 


4,96 


5 mM 




1,0 M 


0,219 


10 


4,71 


5 mM 


Methytformamid 


0,3 M 


0,141 


15 


4,57 


5 mM 




0,6 M 


0,790 


17 


1,04 


5 mM 


Acetamid 


0 ; 6 M 


0,150 


24 


5,34 


5 mM 




1,0 M 


1,321 


16 


1=57 


5 mM 


Methylharnstotf 


0,3 M 


0,168 


24 


4,67 


5 mM 




0,6 M 


0,830 


22 


4,59 


5 mM 


Ethylharnstoff 


0,3 M 


0,266 


23 


4,20 


5 mM 




0,6 M 


1,209 


17 


0,82 


5 mM 



Beispiel 10: 

Expression eines funktionellen Single-Chain-Fv-Fragmentes unter Zusatz von reduziertem Glutathion und L- 
Arginin zum Kulturmedium 



[0054] Eine stationare Ubernachtkultur von E. coli BL21(DE3), die mit einem Plasmid, welches fur ein Single-chain- 
F v -Fragment eines anti-TSH Antikorpers codiert und pUBS520 translormiert wurde, wurde im Verhaltnis 1:50 in 100 
ml LB-Medium mit Ampicillin (100 ng/ml) und Kanamycin (50 u.g/ml, Fluka Chemica, Neu-Ulm) verdunnt und bei 24°C 
und 170 rpm geschuttell. Nach 3 h Wachstum wurden je 5ml der Kultur zu je 10 ml LB-Medium mit o.g. Mengen an 
Ampicillin und Kanamycin und verschiedenen Konzentrationen von GSH (0-10 mM, Fluka) und L-Arginin HCI (0-0,4 
M : ICN) gegeben und mit jeweils 1mM IPTG (Isopropyl-p-D-Thiogalactosid, AppliChem, Darmstadt) induziert. Die Zel- 
len wurden weitere 21 h bei 24 °C und 170 rpm geschuttelt und nach Bestimmung der OD 600 eine 1 mi-Probe genom- 
men. Diese 1 ml-Zellproben wurden nach einer modifizierten Vorschrift nach Jacobi et al. (J. Biol. Chem. 272 (1997) 
21692-21699) in 2 ml-Eppendorf-ReaktionsgefaBen fraktioniert (s. Beispie! 8). Weiterhin wurde eine Probe des Medi- 
enuberstandes (1 ml) genommen, Zur Analyse der Proben auf funktionellen Antikorpern wurden sie einem ELISA-Test 
unterzogen. 

[0055] Der Zusatz von L-Arginin und GSH zum Kulturmedium im Falle der Expression von ScFv-TSH hatte ebenfalls 
einen positiven EinfluG auf die Ausbeute an nativern ScFv-TSH im Periplasma und im Medium-Uberstand von E. coli. 
Bei Zugabe von 0,4 M L-Arginin und 5 mM GSH konnte die Menge an mittels ELISA detektiertem Antikdrperfragment 
im Medien-Oberstand urn das 39-fache (Fig. 8) und in der periplasmatischen Fraktion urn das 10-fache (Fig. 9) ge- 
genuber einer Kultivierung ohne Medienzusatze gesteigert werden. 
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SEQUENZPROTOKOLL 

5 <110> F. Hoffmann-La Roche AG 

<120> Verfahren zur Herstellung von natuerlich 

gefalteten und sekretierten Proteinen 

70 <130> Cass 20379 

<160> 10 

<210> 1 

75 <211> 1881 

<212> DNA 

<213> E. coli 



20 



SO 



<220> 

<221> CDS 



<222> (392) . . . (159a) 

<4O0> 1 

25 TAGG CGTATC ACGAGGCCCT TTGGATAACC AGAAGCAATA AAAAATCAAA TCGGATTTCA 60 

CTATATAATC TCACTTTATC TAAGATGAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 120 

TTTTTATCTA AAACCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 

30 

TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 24 0 

GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTTTAT GCTTCCGGCT CGTATAATGT 300 

35 GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 360 

TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Mec Lys Lys Thr Ala He Ala 
1 5 

40 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 460 
He Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly He 
10 15 20 

45 CCA GCT AAG CAA GAT TAT TAC GAG ATT TTA GGC GTT TCC AAA ACA GCG 508 

Pro Ala Lys Gin Asp Tyr Tyr Glu He Leu Gly Val Ser Lvs Thr Ala 
25 30 35 



55 



GAA GAG CGT GAA ATC AGA AAG GCC TAC AAA CGC CTG GCC ATG AAA TAC 556 
Glu Glu Arg Glu He Arg Lys Ala Tyr Lys Arg Leu Ala Met Lys Tyr 
4 ° 45 50 55 

CAC CCG GAC CGT AAC CAG GGT GAC AAA GAG GCC GAG GCG AAA TTT AAA 604 
His Pro Asp Arg Asn Gin Gly Asp Lys Glu Ala Glu Ala Lys Phe Lys 
60 65 * 70 
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GAG ATC AAG GAA GCT TAT GAA GTT CTG ACC GAC TCG CAA AAA CGT GCG 652 
Glu He Lys Glu Ala Tyr Glu val Leu Thr Asp Ser Gin Lys Arg Ala 
75 80 85 

5 

GCA TAC GAT CAG TAT GGT CAT GCT GCG TTT GAG CAA GGT GGC ATG GGC 700 
Ala Tyr Asp Gin Tyr Gly His Ala .Ala Phe Glu Gin Gly Gly Met Gly 
90 95 100 

7 0 GGC GGC GGT TTT GGC GGC GGC GCA GAC TTC AGC GAT ATT TTT GGT GAC 74 8 

Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp He Phe Gly Asp 
ICS 110 115 

GTT TTC GGC GAT ATT TTT GGC GGC GGA CGT GGT CGT CAA CGT GCG GCG 796 
75 v *l Phe Gly Asp He Phe Gly Gly Gly Arg Gly Arg Gin Arg Ala Ala 

120 125 130 135 

CGC GGT GCT GAT TTA CGC TAT AAC ATG GAG CTC ACC CTC GAA GAA GCT 84 4 

Arg Gly Ala Asp Leu Arg Tyr Asn Met Glu Leu Thr Leu Glu Glu Ala 
20 140 145 150 

GTA CGT GGC GTG ACC AAA GAG ATC CGC ATT CCG ACT CTG GAA GAG TGT 892 

Val Arg Gly Val Thr Lys Glu He Arg He Pro Thr Leu Glu Glu Cys 
155 160 165 

25 

GAC GTT TGC CAC GGT AGC GGT GCA AAA CCA GGT ACA CAG CCG CAG ACT 94 0 

Asp Val Cys His Gly Ser Gly Ala Lys Pro Gly Thr Gin Pro Gin Thr 
170 175 180 

30 TGT CCG ACC TGT CAT GGT TCT GGT CAG GTG CAG ATG CGC CAG GGA TTC 988 

Cys Pro Thr Cys His Gly Ser Gly Gin Val Gin Met Arg Gin Gly Phe 
185 190 195 

TTC GCT GTA CAG CAG ACC TGT CCA CAC TGT CAG GGC CGC GGT ACG CTG 103 6 

35 Phe Ala val Gin Gin Thr Cys Pro His Cys Gin Gly Arg Gly Thr Leu 

200 205 210 215 

ATC AAA GAT CCG TGC AAC AAA TGT CAT GGT CAT GGT CGT GTT GAG CGC 1084 
He Lys Asp Pro Cys Asn Lys Cys His Gly His Gly Arg Val Glu Arg 
220 225 , ' 230 



40 



45 



55 



AGC AAA ACG CTG TCC GTT AAA ATC CCG GCA GGG GTG GAC ACT GGA GAC 1132 

Ser Lys Thr Leu Ser Val Lys He Pro Ala Gly Val Asp Thr Gly Asp 
235 240 245 

CGC ATC CGT CTT GCG GGC GAA GGT GAA GCG GGC GAG CAT GGC GCA CCG 1180 

Arg He Arg Leu Ala Gly Glu Gly Glu Ala Gly Glu His Gly Ala Pro 
250 255 260 

GCA GGC GAT CTG TAC GTT CAG GTT CAG GTT AAA CAG CAC CCG ATT TTC 122 8 

Ala Gly Asp Leu Tyr Val Gin Val Gin Val Lys Gin His Pro He Phe 
265 270 275 

GAG CGT GAA GGC AAC AAC CTG TAT TGC GAA GTC CCG ATC AAC TTC GCT 127 6 

Glu Arg Glu Gly Asn Asn Leu Tyr Cys Glu Val Pro He Asn Phe Ala 
280 285 290 295 
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ATG GCG GCG CTG GGT GGC GAA ATC GAA GTA CCG ACC CTT GAT GGT CGC 13 24 

Met Ala Ala Leu Gly Gly Glu lie Glu Val Pro Thr Leu Asp Gly Arg 
300 305 310 

GTC AAA CTG AAA GTG CCT GGC GAA ACC CAG ACC GGT. AAG CTA TTC CGT 13 72 

Val Lys Leu Lys Val Pro Gly Glu Thr Gin Thr Gly Lys Leu Phe Arg 
315 320 325 

ATG CGC GGT - AAA GGC GTC AAG TCT GTC CGC GGT GGC GCA CAG GGT GAT 14 20 

Met Arg Gly Lys Gly Val Lys Ser Val Arg Gly Gly Ala Gin Gly Asp 
330 335 340 

TTG CTG TGC CGC GTT GTC GTC GAA ACA CCG GTA GGC CTG AAC GAA AGG 14 68 

Leu Leu Cys Arg val Val Val Glu Thr Pro Val Gly Leu Asn Glu Arg 
345 350 355 

CAG AAA CAG CTG CTG CAA GAG CTG CAA GAA AGC TTC GGT GGC CCA ACC 1516 
Gin Lys Gin Leu Leu Gin Glu Leu Gin Glu Ser Phe Gly Gly Pro Thr 
360 365 370 375 

GGC GAG CAC AAC AGC CCG CGC TCA AAG AGC TTC TTT GAT GGT GTG AAG 1564 
Gly Glu His Asn Ser Pro Arg Ser Lys Ser Phe Phe Asp Gly Val Lys 
380 385 390 

AAG TTT TTT GAC GAC CTG ACC CGC TAA GGATCCGGCT GAGCAACGAC 1611 
y Lys Phe Phe Asp Asp Leu Thr Arg * 

395 400 

- 0 GTGAACGCAA TGCGTTCCGA CGTTCAGGCT GCTAAAGATG ACGCAGCTCG TG CTAACC AG 1671 

CGTCTGGACA ACATGGCTAC TAAATAC CGC AAGTAATAGT ACCTGTGAAG TGAAAAATGG 1731 

CGCACATTGT GCGACATTTT TTTTGTCTGC CG TTT AC CGC TACTGCGTCA CG CGTAAC AT 17 91 

ATTCCCTTGC TCTGGTTCAC CATTCTGCGC T3ACTCTACT GAAGGCGCAT TGCTGGCTGC 1851 

GGGAGTTGCT CCACTGCTCA CCGAAACCGG 1881 

40 

<210> 2 
<2 11 > 400 
<212> PRT 
<213> E. coli 

<400> 2 

Met Lys Lys Thr Ala He Ala He Ala Val Ala Leu Ala Gly Phe Ala 
so 1 5 10 15 

Thr Val Ala Gin Ala Gly He Pro Ala Lys Gin Asp Tyr Tyr Glu He 
20 25 30 

55 Leu G1 Y Val Ser Lys Thr Ala Glu Glu Arg Glu He Arg Lys Ala Tyr 

35 40 45 



35 



45 
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Lys Arg Leu Ala Met Lys Tyr His Pro Asp Arg Asn Gin Gly Asp Lys 
50 55 60 

Glu Ala Glu Ala Lys Phe Lys Glu lie Lys Glu Ala Tyr Glu Val Leu 
.65 70 75 80 

Thr Asp Ser Gin Lys Arg Ala Ala Tyr Asp Gin Tyr Gly His Ala Ala 
85 90 95 

Phe Glu Gin Gly Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp 
100 105 110 

Phe Ser Asp He Phe Gly Asp Val Phe Gly Asp He Phe Gly Gly Gly 
115 120 125 

Arg Gly Arg Gin Arg Ala Ala Arg Gly Ala Asp Leu Arg Tyr Asn Met 
130 135 140 

Glu Leu Thr Leu Glu Glu Ala Val Arg Gly Val Thr Lys Glu He Arg 
145 150 155 160 

He Pro Thr Leu Glu Glu Cys Asp Val Cys His Gly Ser Gly Ala Lys 
165 170 175 

Pro Gly Thr Gin Pro Gin Thr Cys Pro Thr Cys His Gly Ser Gly Gin 
180 185 190 

Val Gin Met Arg Gin Gly Phe Phe Ala Val Gin Gin Thr Cys Pro His 
195 200 205 

Cys Gin Gly Arg Gly Thr Leu He Lys Asp Pro Cys Asn Lys Cys His 
210 215 220 

Gly His Gly Arg Val Glu Arg Ser Lys Thr Leu Ser Val Lys He Pro 
225 230 235 240 

Ala Gly Val Asp Thr Gly Asp Arg He Arg Leu Ala Gly Glu Gly Glu 
245 250 255 

Ala Gly Glu His Gly Ala Pro Ala Gly Asp Leu Tyr Val Gin Val Gin 
260 265 270 

Val Lys Gin His Pro He Phe Glu Arg Glu Gly Asn Asn Leu Tyr Cys 
275 280 285 

Glu Val Pro He Asn Phe Ala Met Ala Ala Leu Gly Gly Glu He Glu 
290 295 300 

Val Pro Thr Leu Asp Gly Arg Val Lys Leu Lys Val Pro Gly Glu Thr 
305 310 315 320 

Gin Thr Gly Lys Leu Phe Arg Met Arg Gly Lys Gly Val Lys Ser Val 
325 330 335 

Arg Gly Gly Ala Gin Gly Asp Leu Leu Cys Arg Val Val Val Glu Thr 
340 345 350 
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10 



Pro Val Gly Leu Asn Glu Arg Gin Lys Gin Leu Leu Gin Glu Leu Gin 

355 360 365 

Glu Ser Phe Gly Gly Pro Thr Gly Glu His Asn Ser Pro Arg Ser Lys 

370 375 380 

Ser Phe Phe Asp Gly Val Lys Lys Phe Phe Asp Asp Leu Thr Arg * 

385 390 395 " 400 



<210> 3 

<211> 1381 

15 <212> DMA 

<213> E. coli 

<220> 

<221> CDS 

20 <222> (392) . . . (790) 

<400> 3 



25 



30 



35 



40 



SO 



TAGGCGTATC ACGAGGCCCT TTGG ATAAC C AGAAGCAATA AAAAATCAAA TCGGATTTCA 60 

CTATATAATC TCACTTTATC TAAGATGAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 120 

TTTTTATCTA AA^CCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 

TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 240 

GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTT7AT GCTTCCGGCT CGTATAATGT 3 00 

GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 3 60 

TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Ly3 Thr Ala lie Ala 
1 5 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 4 60 
lie Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly lie 
10 15 20 



CCA GCT AAG CAA GAT TAT TAC GAG ATT TTA GGC GTT TCC AAA ACA GCG 508 
Pro Ala Lys Gin Asp Tyr Tyr Glu He Leu Gly Val Ser Lys Thr Ala 
45 25 30 35 

GAA GAG CGT GAA ATC AGA AAG GCC TAC AAA CGC CTG GCC ATG AAA TAC 556 
Glu Glu Arg Glu He Arg Lys Ala Tyr Lys Arg Leu Ala Met Lys Tyr 
40 45 50 55 



CAC CCG GAC CGT AAC CAG GGT GAC AAA GAG GCC GAG GCG AAA TTT AAA 
His Pro Asp Arg Asn Gin Gly Asp Lys Glu Ala Glu Ala Lys Phe Lys 
.60 65 70 



604 



55 
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40 



45 



GAG ATC AAG GAA GCT TAT GAA GTT CTG ACC GAC TCG CAA AAA CGT GCG 652 
Glu He Lys Glu Ala Tyr Glu Val Leu Thr Asp Ser Gin Lys Arg Ala 
75 80 85 



GCA TAC GAT CAG TAT GGT CAT GCT GCG TTT GAG CAA GGT GGC ATG GGC 
Ala Tyr Asp Gin Tyr Gly His Ala Ala Phe Glu Gin Gly Gly Met Gly 
50 95 100 



700 



GGC GGC GGT TTT GGC GGC GGC GCA GAC TTC AGC GAT ATT TTT GGT GAC 748 
Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp He Phe Gly Asp 
105 110 115 

GTT TTC GGC GAT ATT TTT GGC GGC GGA CGT GGT CGT TAA TAG 7 90 

Val Phe Gly Asp He Phe Gly Gly Gly Arg Gly Arg * * 
120 125 130 

GCGGCG CGC3 GTGCTGATTT ACGCTATAAC ATGGAGCTCA CCCTCGAAGA AGCTGTACGT 850 
GGCGTGACCA AAGAGATCCG CATTCCGACT CTGGAAGAGT GTGACGTTTG CCACGGTAGC 910 
GGTGCAAAAC CAGGTACACA GCCGCAGACT TGTCCG AC CT G TC ATG G TTC TGGTCAGGTG 970 

CAGATGCGCC AGGGATTCTT CGCTGTACAG CAGACCTGTC CACACTGTCA GGGCCGCGGT 1030 

ACGCTGATCA AAGATCCGTG CAACAAATGT CATGGTCATG GTCGTGTTGA GCGCAGCAAA 1090 

ACGCTGTCCG TTAAAATCCC GGCAGGGGTG GACACTGGAG ACCGCATCCG TCTTGCGGGC 1150 

GAAGGTGAAG CGGGCGAGCA TGGCGCACCG GCAGGCGATC TGTACGTTCA GGTTCAGGTT 1210 

AAACAGCACC CGATTTTCGA GCGTGAAGGC AACAACCTGT ATTGCGAAGT CCCGATCAAC 1270 

TTCGCTATGG CGGCGCTGGG TGGCGAAATC GAAGTACCGA CCCTTGATGG TCGCGTCAAA 13 30 

35 CTGAAAGTGC CTGGCGAAAC CCAGACCGGT AAGCTATTCC GTATGCGCGG TAAAGGCGTC 13 90 

AAGTCTGTCC GCGGTGGCGC ACAGGGTGAT TTGCTGTGCC GCGTTGTCGT CGAAACACCG 14 50 

GTAGGCCTGA ACGAAAGGCA GAAACAGCTG CTG C AAG AGC TGCAAGAAAG CTTCGGTGGC 1510 

CCAACCGGCG AGCACAACAG CCCGCGCTCA AAGAGCTTCT TTGATGGTGT GAAGAAGTTT 157 0 

TTTGACGACC TGACCCGCTA AGGATCCGGC TGAGCAACGA CGTGAACGCA ATGCGTTCCG 163 0 

ACGTTCAGGC TGCTAAAGAT GACGCAGCTC GTGCTAACCA GCGTCTGGAC AACATGGCTA 1690 

CTAAATACCG CAAGTAATAG TACCTGTGAA GTGAAAAATG GCGCACATTG TGCGACATTT 1750 

TTTTTGTCTG CCGTTTACCG CTACTGCGTC ACGCGTAACA TATTCCCTTG CTCTGGTTCA 1310 

SO CCATTCTGCG CTGACTCTAC TGAAGGCGCA TTGCTGGCTG CGGGAGTTGC TCCACTGCTC 1870 

ACCGAAACCG G 1881 



55 
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to 



15 



20 



25 



<210> 4 

<211> 133 

<212> PRT 

<213> E. coli 

<400> 4 

Met Lys Lys Thr Ala He Ala He Ala Val Ala Leu Ala Gly Phe Ala 
15 10 15 

Thr Val Ala Gin Ala Gly He Pro Ala Lys Gin Asp Tyr Tyr Giu He 
- 20 25 30 

Leu Gly Val Ser Lys Thr Ala Glu Glu Arg Glu He Arg Lys Ala Tyr 
35 40 45 

Lys Arg Leu Ala Met Lys Tyr His Pro Asp Arg Asn Gin Gly Asp Lys 
50 55 60 

Glu Ala Glu Ala Lys Phe Lys Glu He Lys Glu Ala Tyr Glu Val Leu 
65 70 75 80 

Thr Asp Ser Gin Lys Arg Ala Ala Tyr Asp Gin Tyr Gly His Ala Ala 
85 90 95 

Phe Glu Gin Gly Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp 
100 105 110 

Phe Ser Asp He Phe Gly Asp Val Phe Gly Asp He Phe Gly Gly Gly 
30 115 120 125 

Arg Gly Arg * * 

130 

35 

<210> 5 
<211> 1379 
<212> DNA 
<213> E. coli 

<220> 

<221> CDS 

<222> (392) . . . (1090) 

45 <400> 5 

TAGGCGTATC ACGAGGCCCT TTGGATAACC AGAAGCAATA AAAAATCAAA TCGGATTTCA 60 

CTATATAATC TCACTTTATC TAAGATCAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 120 

TTTTTATCTA AAACCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 

TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 240 

55 GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTTTAT GCTTCCGGCT CGTATAATGT 3 00 



40 



SO 
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w 



15 



20 



25 



35 



40 



45 



SO 



ss 



GTGG AATTG T GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 3 60 

TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Lys Thr Ala lie Ala 
1 5 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 46 0 
lie Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly lie 
10 15 20 



CTC ACC GAG CGC CGC GTG CCC TTC TCG CTG CTG CGG AGC CCG AGC TGG 
Leu Thr Glu Arg Arg Val Pro Phe Ser Leu Leu Arg Ser Pro Ser Trp 
25 30 35 



GAG GGC CCC GCG GCG GTG ACC CTG GCC GCA CCA GCC TTC AGC CGA GCG 
Glu Gly Pro Ala Ala Val Thr Leu Ala Ala Pro Ala Phe Ser Arg Ala 
30 9 0 95 100 



AAA TAC ACG CTC CCT CCA GGT GTG GAC CCC ACC CTA GTG TCC TCT TCC 
Lys Tyr Thr Leu Pro Pro Gly Val Asp Pro Thr Leu Val Ser Ser Ser 
"0 175 180 

CTA TCC CCT GAG GGC ACA CTT ACC GTG GAG GCT CCG TTG CCC AAA GCA 
Leu Ser Pro Glu Gly Thr Leu Thr Val Glu Ala Pro Leu Pro Lys Ala 
18 5 190 195 



508 



GAA CCA TTC CGG GAC TGG TAC CCT GCA CAC AGC CGC CTC TTC GAT CAA 556 

Glu Pro Phe Arg Asp Trp Tyr Pro Ala His Ser Arg Leu Phe Asp Gin 
40 45 50 55 

GCT TTC GGG GTG CCC CGG TTG CCC GAT GAG TGG TCG CAG TGG TTC AGC 604 

Ala Phe Gly Val Pro Arg Leu Pro Asp Glu Trp Ser Gin Trp Phe Ser 
60 65 70 

GCC GCT GGG TGG CCC GGA TAC GTG CGC CCG CTG CCC GCC GCG ACC GCC 652 

Ala Ala Gly Trp Pro Gly Tyr Val Arg Pro Leu Pro Ala Ala Thr Ala 
75 80 85 



700 



CTC AAC CGA CAG CTC AGC AGC GGG GTC TCG GAG ATC CGA CAG ACG GCT 74 8 

Leu Asn Arg Gin Leu Ser Ser Gly Val Ser Glu lie Arg Gin Thr Ala 
105 no us 

GAT CGC TGG CGC GTG TCC CTG GAC GTC AAC CAC TTC GCT CCG GAG GAG 796 
Asp Arg Trp Arg Val Ser Leu Asp Val Asn His Phe Ala Pro Glu Glu 
120 125 130 135 

CTC ACA GTG AAG ACC AAG GAA GGC GTG GTG GAG ATC ACT GGC AAG CAC 84 4 

Leu Thr Val Lys Thr Lys Glu Gly Val Val Glu He Thr Gly Lys His 

140 145 --*■ 150 

GAA GAA AGG CAG GAC GAA CAT GGC TAC ATC TCT CGG TGC TTC ACC CGG 8 92 

Glu Glu Arg Gin Asp Glu His Gly Tyr He Ser Arg Cys Phe Thr Arg 
155 160 165 



940 



988 
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10 



15 



20 



35 



40 



45 



GTC ACG CAG TCA GCG GAG ATC ACC ATT CCG GTT ACT TTC GAG GCC CGC 1036 

Val Thr Gin Ser Ala Glu lie Thr He Pro Val Thr Phe Glu Ala Arg 

200 205 210 215 

GCC CAA ATT GGG GGC CCA GAA GCT GGG AAG TCT GAA CAG TCT GGA GCC 10 84 

Ala Gin He Gly Gly Pro Glu Ala Gly Lys Ser Glu Gin Ser Gly Ala 
220 225 230 

AAG TAG GATCCGGCTG AGCAACGACG TGAACGCAAT GCGTTCCGAC GTTCAGGCTG 114 0 

Lys 



CTAAACATCA CGCAGCTCGT GCTAACCAGC GTCTGGACAA CATGGCTACT AAATACCGCA 12 00 

AGTAATAGTA CCTGTGAAGT GAAAAATGGC GCACATTGTG CGACATTTTT TTTGTCTGCC 1260 

GTTTACCGCT ACTGCGTCAC GCGTAACATA TTCCCTTGCT CTGGTTCACC ATTCTGCGCT 132 0 

GACTCTACTG AAGGCGCATT GCTGGCTGCG GGAGTTGCTC CACTGCTCAC CGAAACCGG 13 79 



<210> 6 

<211> 233 

25 <212> PHT 

<213v E roli 

<400> 6 

30 Met Lys Lys Thr Ala He Ala He Ala Val Ala Leu Ala Gly Phe Ala 

15 10 15 

Thr Val Ala Cln Ala Gly He Leu Thr Glu Arg Arg Val Pro Phe Ser 
20 25 30 



Leu Leu Arg Ser Pro Ser Trp Glu Pro Phe Arg Asp Trp Tyr Pro Ala 
35 40 45 

His Ser Arg Leu Phe Asp Gin Ala Phe Gly Val Pro Arg Leu Pro Asp 
50 55 60 

Glu Trp Ser Gin Trp Phe Ser Ala Ala Gly Trp Pro Gly Tyr Val Arg 
65 70 75 80 

Pro Leu Pro Ala Ala Thr Ala Glu Gly Pro Ala Ala Val Thr Leu Ala 
85 90 95 

Ala Pro Ala Phe Ser Axg Ala Leu Asn Arg Gin Leu Ser Ser Gly Val 
100 105 110 

Ser Glu He Arg Gin Thr Ala Asp Arg Trp Arg Val Ser Leu Asp Val 
US 120 125 

Asn His Phe Ala Pro Glu Glu Leu Thr Val Lys Thr Lys Glu Gly Val 
130 135 140 



55 
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Val Glu He Thr Gly Lys His Glu Glu Arg Gin Asp Glu His Gly Tyr 
145 150 155 160 

He Ser Arg Cys Phe Thr Arg Lys Tyr Thr Leu Pro Pro Gly Val Asp 
165 170 175 

Pro Thr Leu Val Ser Ser Ser Leu Ser Pro Glu Gly Thr Leu Thr Val 
180 185 190 

Glu Ala Pro Leu Pro Lys Ala Val Thr Gin Ser Ala Glu He Thr He 
195 200 205 

Pro Val Thr Phe Glu Ala Arg Ala Gin lie Gly Gly Pro Glu Ala Gly 
210 215 220 

Lys Ser Glu Gin Ser Gly Ala Lys * 
225 230 



20 <210> 7 

<2H> 1256 

<212> DNA 

<213> E. coli 

25 <220> 

<221> CDS 

<222> (199) . . . (969) 



10 



75 



30 



<400> 7 

GATCTGGCTT TACACTTTAT GCTTCCGGCT CGTATGTTGT GTGGAATTGT GAGCGGATAA 60 

CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGCCA AGCTTGCATG CAAATTCTAT 120 

35 TTCAAGGAGA CAGTCATAAT GAAATACCTA TTGCCTACGG CAG CCGCTGG ATTGTTATTA 180 

CTCGCGGCCC AGCCGGCC ATG GCC GAG GTC AAG CTG CAG GAG TCT GGG GGA 231 

Met Ala Glu Val Lys Leu Gin Glu Ser Gly Gly 

1 5 10 

40 

GGC TTA GTG CAG CCT GGA GGG TCC CGG AAA CTC TCC TGT GCA GCC TCT 2 79 

Gly Leu Val Gin Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser 

15 20 25 

GGA TTC ACT TTC AGT AGC TTT GGA ATG CAC TGG GTT CGT CAG GCT CCA 327 
Gly Phe Thr Phe Ser Ser Phe Gly Met His Trp Val Arg Gin Ala Pro ~ • 

30 35 40 

GAG AAG GGG CTG GAG TGG GTC GCA TAT ATT AGT AGT GGC AGT AGT ACC 3 75 

Glu Lye Gly Leu Glu Trp Val Ala Tyr He Ser Ser Gly Ser Ser Thr 
SO 45 50 55 

ATC TAC TAT GCA GAC ACA GTG AAG GGC CGA TTC ACC ATC TCC AGA GAC 423 

He Tyr Tyr Ala Asp Thr Val Lys Gly Arg Phe Thr He Ser Arg Asp 

60 65 70 75 

55 
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AAT CCC AAG AAC ACC CTG TTC CTG CAA ATG ACC AGT CTA AGS TCT GAG 4 71 

Asn Pro Lys Asn Thr Leu Phe Leu Gin Met Thr Ser Leu Arg Ser Glu 
BO 85 90 

GAC ACG GCC ATG TAT TAC TGC GCA AGA GAT TAC GGG GCT TAT TGG GGC 519 

Asp Thr Ala Met Tyr Tyr Cys Ala Arg Asp Tyr Gly Ala Tyr Trp Gly 
95 100 105 

CAA GGG ACC ACG GTC ACC GTC TCC TCA GGT GGA GGC GGT TCA GGC GGA 567 

Gin Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly Gly 

110 115 120 

GGT GGC TCT GGC GGT GGC GGA TCG GAC ATT GAG CTC ACC CAG TCT CCA 615 

Gly G3y Ser Gly Gly Gly Gly Ser Asp He Glu Leu Thr. Gin Ser Pro 
125 130 135 

GCA ATC ATG TCT GCA TCT CCA GGG GAG AAG GTC ACC ATG ACC TGC AGT 663 

Ala He Met Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser 
140 145 150 155 

GCC AGT TCA AGT GTA AGG TAC ATG AAC TGG TTC CAA CAG AAG TCA GGC 711 

Ala Ser Ser Ser Val Arg Tyr Mec Asn Trp Phe Gin Gin Lys Ser Gly 
160 165 170 

25 ACC TCC CCC AAA AGA TGG ATT TAT GAC ACA TCC AAA CTG TCT TCT GGA 759 

Thr Ser Pro Lys Arg Trp He Tyr Asp Thr Ser Lys Leu Ser Ser Gly 
175 180 185 



10 



15 



20 



30 



35 



40 



GTC CCT GCT CGC TTC AGT GGC AGT GGG TCT GGG ACC TCT TAC TCT CTC 807 
Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu 
190 195 200 

ACA ATC AGC AGC ATG GAG GCT GAA GAT GCT GCC ACT TAT TAC TGC CAG 855 
Thr He Ser Ser Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gin 
205 210 215 

CAG TGG AGT AGT AAT CCA CTC ACT TTC GGT GCT GGG ACC AAG CTG GAG 903 
Gin Trp Ser Ser Asn Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu 
220 225 230 235 

CTG AAA CGG GCG GCC GCA GAA CAA AAA CTC ATC TCA GAA GAG GAT CTG 951 
Leu Lys Arg Ala Ala Ala Glu Gin Lys Leu He Ser Glu Glu Asp Leu 
240 245 250 

AAT GGG GCC GCA TAG TAA CTGAGCAACG ACGTGAACGC AATGCGTTCC 999 
45 Asn Gly Ala Ala * * 

255 

GACGTTCAGG CTGCTAAAGA TGACGCAGCT CGTGCTAACC AGCGTCTGGA CAACATGGCT 10 5 9 

SO ACTAAATACC GCAAGTAATA GTACCTGTGA AGTGAAAAAT GGCGCACATT GTGCGACATT 1119 

TTTTTTGTCT GCCGTTTACC GCTACTGCGT CACGCGTAAC ATATTCCCTT G CTCTGGTTC 117 9 
ACCATTCTGC GCTGACTCTA CTGAAGGCGC ATTGCTGGCT GCGGGAGTTG CTCCACTGCT 123 9 

55 
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10 



15 



20 



CACCGAAACC GGAGATC 12 56 



c210> 8 

<2\\>' 257 

<212> PRT 

<213> E. coli 

<400> 8 

Met Ala Glu Val Lys Leu Gin Glu Ser Gly Gly Gly Leu Val Gin Pro- 
1 5 10 15 

Gly Gly Ser Arg Lys Leu Ser C/s Ala Ala Ser Gly Phe Thr Phe Ser 
20 25 30 

Ser Phe Gly Met His Trp Val Arg Gin Ala Pro Glu Lys Gly Leu Glu 
35 40 45 

Trp Val Ala Tyr lie Ser Ser Gly Ser Ser Thr He Tyr Tyr Ala Asp 
50 55 60 

Thr Vai Lys Gly Arg Phe Thr He Ser Arg Asp Asn Pro Lys Asn Thr 
25 6S 70 75 80 

Leu Phe Leu Glr. Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met Tyr 
85 90 95 

30 r[ V r c / s Ala ^9 ~ S P Gly Ala Tyr Trp Gly Gin Gly Thr Thr Val 

100 105 HO 

Thr val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 
115 120 125 

35 

Gly Gly Ser Asp He Glu Leu Thr Gin Ser Pro Ala He Met Ser Ala 
130 135 140 

Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val 
145 150 155 160 

Arg Tyr Met Asn Trp Phe Gin Gin Lys Ser Gly Thr Ser Pro Lys Arg 
165 170 175 

Trp He Tyr Asp Thr Ser Lys Leu Ser Ser Gly Val Pro Ala Arg Phe 
45 180 185 190 

Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr He Ser Ser Met 
195 200 205 

50 Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gin Gin Trp Ser Ser Asn 

210 215 220 

Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg Ala Ala 
225 230 235 240 

55 



40 
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Ala Glu Gin Lys Leu lie Ser Glu Glu Asp Leu Asn Gly Ala Ala + 
245 250 255 

5 



70 



15 



20 



35 



40 



45 



<210 > 9 

<211> 1137 

<212> DNA 

< 2 1 2 > E. coli 

<220> 

<221> CDS 

<222> (1) . . . (1137) 

<400> 9 

ATG AAA TAC CTG CTG CCG ACC GCT GCT GCT GGT CTX3 CTG CTC CTC GCT 

Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 
1 5 10 15 



48 



GCC CAG CCG GCG ATG GCC ATG GCT TAC CAA GGA AAC AGT GAC TGC TAC 96 
Ala Gin Pro Ala Met Ala Met Ala Tyr Gin Gly Asn Ser Asp Cys Tyr 
25 20 25 30 

TTT GGG AAT GGG TCA GCC TAC CGT GGC ACG CAC AGC CTC ACC GAG TCG 144 

Phe Gly Asn Gly Ser Ala Tyr Arg Gly Thr His Ser Leu Thr Glu Ser 
35 40 45 

30 

GGT GCC TCC TGC CTC CCG TGG AAT TCC ATG ATC CTG ATA GGC AAG GTT 192 

Gly Ala Ser Cys . Leu Pro Trp Asn Ser Met lie Leu lie Gly Lys Val 
50 55 60 

TAC ACA GCA CAG AAC CCC AGT GCC CAG GCA CTG GGC CTG GGC AAA CAT 24 0 

Tyr Thr Ala Gin Asn Pro Ser Ala Gin Ala Leu Gly Leu Gly Lys His 
65 70 75 80 

AAT TAC TGC CGG AAT CCT GAT GGG GAT GCC AAG CCC TGG TGC CAC GTG 28 8 

Asn Tyr Cys Arg Asn Pro Asp Gly Asp Ala Lys Pro Trp Cys His Val 
85 90 95 

CTG ACG AAC CGC AGG CTG ACG TGG GAG TAC TGT GAT GTG CCC TCC TGC 336 
Leu Thr Asn Arg Arg Leu Thr Trp Glu Tyr Cys Asp Val Pro Ser Cys 
100 105 110 

TCC ACC TGC GGC CTG AGA CAG TAC AGC CAG CCT CAG TTT CGC ATC AAA 3 84 

Ser Thr Cys Gly Leu Arg Gin Tyr Ser Gin Pro Gin Phe Arg lie Lys 
115 120 125 

SO GGA GGG CTC TTC GCC GAC ATC GCC TCC CAC CCC TGG CAG GCT GCC ATC 43 2 

Gly Gly Leu Phe Ala Asp lie Ala Ser His Pro Trp Gin Ala Ala lie 
130 135 140 
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10 



15 



20 



30 



35 



40 



45 



TTT GCC AAG CAC AGG AGG TCG CCC GGA GAG CGG TTC CTG TGC GGG GGC 480 

Phe Ala Lys His Arg Arg Ser Pro Gly Glu Arg Phe Leu Cys Gly Gly 

!45 150 155 160 

ATA CTC ATC AGC TCC TGC TGG ATT CTC TCT GCC GCC CAC TGC TTC CAG 528 

lie Leu lie Ser Ser Cys Trp lie Leu Ser Ala Ala His Cys Phe Gin 

165 170 175 

GAG ACC TTT CCC CCC CAC CAC CTG ACG GTG ATC TTG GGC AG A ACA TAC 576 

Glu Arg Phe Pro Pro His His Leu Thr Val lie Leu Gly Arg Thr Tyr 

180 185 190 

CGG GTG GTC CCT GGC GAG GAG GAG CAG AAA TTT GAA GTC GAA AAA TAC 624 

Arg Val Val Pro Gly Glu Glu Glu Gin Lys Phe Glu Val Glu Lys Tyr 
195 200 205 

ATT GTC CAT AAG GAA TTC GAT GAT GAC ACT TAC GAC AAT GAC ATT GCG 672 

He Val His Lys Glu Phe Asp Asp Asp Thr Tyr Asp Asn Asp lie Ala 
210 215 220 

CTG CTG CAG CTG AAA TCG GAT TCG TCC CGC TGT GCC CAG GAG AGC AGC 720 

Leu Leu Gin Leu Lys Ser Asp Ser Ser Arg Cys Ala Gin Glu Ser Ser 

225 230 235 240 



25 GTG GTC CGC ACT GTG TGC CTT CCC CCG GCG GAC CTG CAG CTG CCG GAC 

Val Val Arg Thr Val Cys Leu Pro Pro Ala Asp Leu Gin Leu Pro Asp 
245 250 255 



768 



TGG ACG GAG TGT GAG CTC TCC GGC TAC GGC AAG CAT GAG GCC TTG TCT 816 
Trp Thr Glu Cys Glu Leu Ser Gly Tyr Gly Lys His Glu Ala Leu Ser 
260 265 270 

CCT TTC TAT TCG GAG CGG CTG AAG GAG GCT CAT GTC AGA CTG TAC CCA 864 
Pro Phe Tyr Ser Glu Arg Leu Lys Glu Ala His Val Arg Leu Tyr Pro 
275 280 285 

TCC AGC CGC TGC ACA TCA CAA CAT TTA CTT AAC AGA ACA GTC ACC GAC 912 
Ser Ser Arg Cys Thr Ser Gin His Leu Leu Asn Arg Thr Val Thr Asp 
290 295 300 

AAC ATG CTG TGT GCT GGA GAC ACT CGG AGC GGC GGG CCC CAG GCA AAC 960 
Asn Met Leu Cys Ala Gly Asp Thr Arg Ser Gly Gly Pro Gin Ala Asn 
305 310 315 320 

TTG CAC GAC GCC TGC CAG GGC GAT TCG GGA GGC CCC CTG GTG TGT CTG 1008 
Leu His Asp Ala Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Leu 
325 330 335 



AAC GAT GGC CGC ATG ACT TTG GTG GGC ATC ATC AGC TGG GGC CTG GGC 1056 

Asn Asp Gly Arg Met Thr Leu Val Gly He He Ser Trp Gly Leu Gly 
50 340 345 350 

TGT GGA CAG AAG GAT GTC CCG GGT GTG TAC ACC AAG GTT ACC AAC TAC 1104 

Cys Gly Gin Lys Asp Val Pro Gly Val Tyr Thr Lys Val Thr Asn Tyr 
355 360 365 

55 
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CTA GAC TGG ATT CGT GAC AAC ATG CGA CCG TGA 
Leu Asp Trp He Arg Asp Asn Met Arg Pro * 
370 375 



<210> 10 

<211> 379 

<212> . PRT 

<213> E. coli 

<400> 10 

Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 
1 5 10 15 

Ala Gin Pro Ala Met Ala Met Ala Tyr Gin Gly Asn Ser Asp Cys Tyr 
20 25 3D 

Phe Gly Asn Gly Ser Ala Tyr Arg Gly Thr His Ser Leu Thr Glu Ser 
35 40 45 

Gly Ala Ser Cys Leu Pro Trp Asn Ser Met He Leu He Gly Lys Val 
50 55 60 

Tyr Thr Ala Gin Asn Pro Ser Ala Gin Ala Leu Gly Leu Gly Lys His 
65 70 75 80 

Asn Tyr Cys Arg Asn Pro Asp Gly Asp Ala Lys Pro Trp Cys His Val 
85 90 95 

Leu Thr Asn Arg Arg Leu Thr Trp Glu Tyr Cys Asp Val Pro Ser Cys 
100 105 HO 

Ser Thr Cys Gly Leu Arg Gin Tyr Ser Gin Pro Gin Phe Arg He Lys 
H5 120 125 

Gly Gly Leu Phe Ala Asp He Ala Ser His Pro Trp Gin Ala Ala He 
130 135 140 

Phe Ala Lys His Arg Arg Ser Pro Gly Glu Arg Phe Leu Cys Gly Gly 
145 150 155 160 

He Leu He Ser Ser Cys Trp He Leu Ser Ala Ala His Cys Phe Gin 
165 170 175 

Glu Arg Phe Pro Pro His His Leu Thr Val He Leu Gly Arg Thr Tyr 
180 185 190 

Arg Val Val Pro Gly Glu Glu Glu Gin Lys Phe Glu Val Glu Lys Tyr 
195 200 205 

He Val His Lys Glu Phe Asp Asp Asp Thr Tyr Asp Asn Asp He Ala 
210 215 220 
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w 



15 



20 



25 



30 



Leu Leu Gin Leu Lys Ser Asp Ser Ser Arg Cys Ala Gin Glu Ser Ser 
225 230 235 240 

Val Val Arg Thr Val Cys Leu Pro Pro Ala Asp Leu Gin Leu Pro Asp 
245 250 255 

Trp Thr Glu Cys Glu Leu Ser Gly Tyr Gly Lys His Glu Ala Leu Ser 
260 265 270 

Pro Phe Tyr Ser Glu Arg Leu Lys Glu Ala His Val Arg Leu Tyr Pro 
275 280 285 

Ser Ser Arg Cys Thr Ser Gin His Leu Leu Asn Arg Thr Val Thr Asp 
290 295 300 

Asn Met Leu Cys Ala Gly Asp Thr Arg Ser Gly Gly Pro Gin Ala Asn 
305 310 315 320 

Leu His Asp Ala Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Leu 
325 330 335 

Asn Asp Gly Arg Met Thr Leu Val Gly lie lie Ser Trp Gly Leu Gly 
340 345 350 

Cys Gly Gin Lys Asp Val Pro Gly Val Tyr Thr Lys Val Thr Asn Tyr 
355 360 365 

Leu Asp Trp lie Arg Asp Asn Met Arg Pro * 
370 375 
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40 



45 
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Patentanspruche 

1. Verfahren zur Hersteltung eines wasserldslichen. naturlich gefalteten eukaryontischen Polypeptids, enthaltend 
zwei oder mehrere Ober Disulfidbrucken verknupfte Cysteine, 
durch Kultivierung prokaryontischer Zellen, 

a) wobei die genannten prokaryontischen Zellen einen Expressionsvektor enthalten, der fur das genannte 
Polypeptid, das am N-Terminus eine prokaryontische Signalsequenz enthalt, codiert, 

b) unter Bedingungen, bei denen das Polypeptid in das Periplasma Oder das Medium sekretiert wird, 

c) Abspaltung der Signalsequenz und isoiierung des Polypeptids aus dem Periplasma Oder dem Medium, 

dadurch gekennzeichnet, daG die Kultivierung in Gegenwart von Arginin oder einer Verbindung der allgemeinen 
Formel I 



R 2 -CO-NRR 1 

ertolgt, wobei R und R-, Wasserstott oder eine gesattigte oder ungesattigte verzweigte oder unverzweigte C r C 4 - 
Alkylkette und 

R 2 Wasserstoff, NHR 1 oder eine gesattigte oder ungesattigte verzweigte oder unverzweigte Cj^-Alkylkette dar- 
stellen. 

2. Verlahren nach Anspruch 1 , dadurch gekennzeichnet daG Arginin als Hydrochlorid oder als andere titrierte Form 
verwendet wird. 

3. Verlahren nach den AnsprQchen 1 bis 2, dadurch gekennzeichnet daG dem Nahrmedium ein reduzierendes Thiol- 
reagenz zugesetzt wird. 

4. Verlahren nach Anspruch 3, dadurch gekennzeichnet, daG als reduzierendes Thiolreagenz Glutathbn (GSH) ver- 
wendet wird. 

5. Verlahren nach den AnsprQchen 1 bis 4, dadurch gekennzeichnet, daG die Signalsequenz aus gramnegativen 
Bakterien stammt. 

6. Verlahren nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, daG die prokaryontische Zelle einen wei- 
teren Expressionsvektor, der fur ein molekulares Chaperon codiert, enthalt. 

7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daG das molekulare Chaperon DNAJ aus E coli oder HSP25 
ist. 

8. Verfahren nach einem der Anspruche 6 oder 7, dadurch gekennzeichnet, daG die fur das molekulare Chaperon 
codierende rekombinante DNA in operativer Verknupfung mit einem DNA-Fragment steht, das ein Signalpeptid 
zum Durchdringen der inneren bakteriellen Membran codiert. 

9. Verfahren nach einem der- Anspruche 6 bis 8, dadurch gekennzeichnet daG sich die fur das sekretierte molekulare 
Chaperon und/oder fur das sekretierte Protein codierende DNA unter Kontrolle eines induzterbaren Expressions- 
signals befindet. 

10. Verfahren nach einem der Anspruche 1 bis 9, dadurch gekennzeichnet, daG das Polypeptid ein Antikorper, Anti- 
korperfragment, Interferon, Proteinhormon oder eine Protease ist. 
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Fig. 3 
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Fig. 4 
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Fig. 5 
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Fig. 8 
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